
Faktasjekk: Nytt "komplett" sjimpansegenom viser 14,9 prosent forskjell fra menneskegenom
Av Casey Luskin. Oversatt herfra
En banebrytende artikkel i Nature -lenke rapporterer om "fullstendig sekvensering av ape-genomer", inkludert genomene til sjimpanser, bonoboer, gorillaer, borneanske orangutanger, sumatra-orangutanger og siamanger -lenke. Jeg bemerket dette i en artikkel her -Del 1, der jeg rapporterte at et evolusjonært ikon - den berømte "1 prosent forskjellen" mellom menneske- og sjimpansegenomene, som er omtalt i bredden av populær og annen vitenskapelig skriving og undervisning - har falt. Forskerne valgte, av en eller annen grunn - jeg er ikke en tankeleser - å begrave dette bemerkelsesverdige funnet i teknisk sjargong i sin tilleggsdata-seksjon. Nå til mer om de vitenskapelige detaljene.
Du tenker kanskje: "Hei, ble ikke disse genomene sekvensert for lenge siden?" Svaret er ja, men også nei. Ja, vi hadde sekvensert genomer fra disse artene tidligere, men som artikkelen forklarer, "på grunn av den repetitive naturen til ape-genomene, har fullstendige sammenstillinger ikke blitt oppnådd. Nåværende referanser mangler sekvensoppløsning av noen av de mest dynamiske genomiske regionene, inkludert regioner som tilsvarer avstamningsspesifikke genfamilier."
Bilde 1. Menneske og sjimpanse i ulike ligaer
Eller, som en tilhørende forklarende artikkel uttrykker det -lenke:
"Tidligere hadde forskere dechiffrert segmenter av ikke-menneskelige apers genomer, men de hadde aldri klart å sette sammen en komplett sekvens for noen art. I den nåværende studien brukte imidlertid [Kateryna] Makova og hennes samarbeidspartnere avanserte sekvenseringsteknikker og algoritmer som tillot dem å lese lange segmenter av DNA og sette dem sammen til en sekvens som strakte seg fra den ene enden av hvert kromosom til den andre, uten noen hull. "Dette har aldri blitt gjort før", sier Makova."
Med andre ord ble de komplette apegenomene aldri fullstendig sekvensert. Og de brukte det menneskelige genomet som en referansesekvens, noe som fikk apegenomene til å se mer menneskelignende ut enn de faktisk var.
Bilde 2. Kakeoppskrift er designet, og så er genomet
Tror du meg ikke?
Fra den tekniske artikkelen: "De fleste tidligere genomomfattende sammenlignende studier av aper har vært begrenset av kartlegging av dårligere sammenstillinger til et menneskelig genom av høyere kvalitet. Følgelig ble menneskelige referanseskjevheter introdusert."
Dette er i samsvar med hva National Center for Biotechnology Information sa i 2007 -lenke om et tidlig utkast av sjimpansegenomet:
"Contigs ble satt sammen ved hjelp av det menneskelige genomet som en veiledning, og er derfor "humanisert" i sin konstruksjon. Dette er et viktig skille, ettersom noen sekvenser, som innsettinger, delesjoner og genduplikasjoner, kanskje ikke er nøyaktig representert av den nåværende sjimpansesamlingen."
Dermed har de fleste versjoner av sjimpanse- og andre apegenomer frem til nå blitt effektivt "humanisert" fordi de ble "satt sammen ved hjelp av det menneskelige genomet som en veiledning". Dette får dem effektivt til å virke mer like det menneskelige genomet enn de egentlig er. Kan disse nye utkastene av apegenomer bidra til å løse problemet?
Problemet løst?
En annen forklarende artikkel -lenke i Nature ser ut til å antyde at disse "komplette" utkastene av apenes genom vil bevise at de er mindre like det menneskelige genomet enn det som har blitt hevdet:
"Kort tid etter at den første menneskelige genomsekvensen ble ferdigstilt i 2003, ble en sjimpansesamling utgitt. Dette ble etterfulgt av samlinger for andre store aper, som gorillaen, sumatra-orangutangen og bonoboen, og små aper som er mindre nært beslektet med mennesker enn store aper. Disse genomene ga en verdifull mulighet til å katalogisere de genetiske forskjellene som har akkumulert under apenes evolusjon, inkludert endringer som er unike for mennesker. Men fordi disse første utgivelsene var ufullstendige utkast, kunne sammenligninger bare gjøres mellom riktig oppløste deler av genomet. Disse studiene fokuserte derfor bare på relativt små forskjeller, og ekskluderte ekstremt repeterende sekvenser og store strukturelle forskjeller, som inversjoner og duplikasjoner av genomsekvenser. "
Bilde 3. Protein-kodende del av genomet: 2prosent hos mennesket
Den siste setningen ser ut til å antyde at tidligere sammenligninger mellom menneske- og apegenomer "bare fokuserte på relativt små forskjeller" og "ekskluderte" de delene som innebærer "storskala strukturelle forskjeller". Den forklarende artikkelen bemerker at denne studien har "fullstendig sekvensert genomene til seks levende apearter, noe som muliggjør lenge etterlengtede sammenligninger av genomiske regioner som er vanskelig å sette sammen". Dermed kunne man forvente at disse nylig "komplette" apegenomene ville avsløre mye større forskjeller sammenlignet med det menneskelige genomet.
De nye apegenomene og det menneskelige genomet
Det som er merkelig er at når man leser den tekniske artikkelen, er det vanskelig å finne en direkte sammenligning mellom ape- og menneskegenomene. Denne passasjen ser ut til å være så nær som den kan komme:
"Totalt sett avslørte sekvenssammenligninger mellom de komplette apegenomene større divergens enn tidligere anslått (Tilleggsnotater III-IV). Faktisk klarte ikke 12,5-27,3 prosent av et apegenom å sammenstilles med, eller var inkonsekvent med, en enkel én-til-én-justering, og dermed introduserte det gap."
Bilde 4. Fossilforskjeller aper-mennesker
Hva betyr egentlig dette? Vel, først innrømmer de at "sekvenssammenligninger blant de komplette apegenomene avdekket større avvik enn tidligere anslått". Men den tekniske Nature-artikkelen anser mennesker for å være en "ape", så implisitt i denne påstanden ligger deres tro på at sammenligning av "apegenomene" inkluderer sammenligninger mellom menneske- og ape- (dvs. ikke-menneskelige hominoider) genomer. Så for resten av denne artikkelen vil jeg kalle mennesker "mennesker" og jeg vil referere til ikke-menneskelige hominoider som "aper", akkurat som de fleste vanlige mennesker gjør.
Interessant nok innleder to forhåndsutgaver av artikkelen (v1 og v2) publisert i fjor på BioRxiv (som antagelig er versjonene av manuskriptet som ble sendt til Nature i utgangspunktet og etter én runde med revisjoner) forespeiler dette resultatet med disse to setningene:
"Den ofte siterte statistikken på ~99 prosent sekvensidentitet mellom sjimpanse og menneske gjelder for mesteparten av genomet når man vurderer enkeltnukleotidvarianter (SNV-er). Sammenligninger av T2T-genomer antyder imidlertid et mye mer nyansert estimat."
T2T betyr å undersøke "telomer til telomer" - dvs. å undersøke hele kromosomene i hele genomet. Disse setningene ble tydeligvis fjernet under revisjoner for den publiserte versjonen i Nature - en interessant redaksjonell avgjørelse. Så hva sier artikkelen om forskjellen mellom mennesker og sjimpanser?
Som vi skal se, er påstanden ovenfor - at "sekvenssammenligninger blant de komplette apegenomene avdekket større divergens enn tidligere anslått" - sann. Men den avslører ikke omfanget av forskjellene mellom menneske- og apegenomene som denne studien avdekket. Så la meg gå rett til saken:
Se tilbake på disse tallene, "12,5-27,3 prosent". De samme tallene dukker opp igjen dypt begravd i tilleggsdataene -lenke der de sammenligner ulike ape- og menneskegenomer. De kan finnes hvis du vet hvor du skal lete, men skal jeg si "begravd" - eller "skjult"? Ut fra det jeg kan se, rapporterer tilleggsdataene at ape-genomet som ligner mest på det menneskelige genomet er sjimpanse-genomet. Og det viser en "gap-divergens" - dvs. forskjell - på 12,5 prosent fra det menneskelige genomet! Og når du ser på "gap-divergensen" der det menneskelige genomet er målet og sjimpansen er søket, er forskjellen 13,3 prosent. La meg være tydelig: I følge denne studien er ikke menneske- og sjimpansegenomene 98,8 prosent like (eller 1,2 prosent forskjellige) - slik for eksempel Smithsonian Institutions National Museum of Natural History hevder (se min "Besøksguide" for mer). Faktisk er de ikke mer enn 87,5 prosent like - dvs. at menneskets og sjimpansegenomet er minst 12,5 prosent forskjellige, om ikke 13,3 prosent forskjellige! Faktisk er forskjellen på 13,3 prosent mer relevant, siden dette gjenspeiler hvor lik hele den menneskelige samlingen er sjimpansegenomet.
Bilde 5. Telomerer styrer livslengde
Hva er egentlig "gapdivergensen"?
Før vi går videre, vil jeg utforske nøyaktig hva forfatterne mener med "gapdivergens" eller "gapforskjell". Artikkelen definerer "gapdivergensen" som følger:
"Gapdivergens er definert som andelen av posisjoner i målhaplotypen som ikke er justert med den andre haplotypen, noe som kan skyldes biologiske prosesser (f.eks. gentap/gevinst og innsettinger/slettinger), manglende data eller tekniske problemer (f.eks. justeringsfeil på grunn av SV-er, repeterende elementer osv.)."
Så hvordan bestemmer de gapdivergensen? Ut fra det jeg kan se, er det basert på å dele målgenomet innenfor genomjusteringen i segmenter på 1 million basepar (1 Mbp) og se hvor mange av basene innenfor hvert 1 Mbp-segment som ikke har noen sammenstillende base innenfor spørregenomet som er justert til det. Hvis hele 1 Mbp-segmentet ikke har noen justering av målgenomet, har det en gapdivergens på 100 prosent. Hvis 10 000 bp ikke har noen justering, har det en gapdivergens på 1 prosent; hvis 1000 bp ikke har noen justering, har det en gapdivergens på 0,1 prosent, osv. I følge studiens resultater er den gjennomsnittlige gapdivergensen i hvert 1 Mbp-segment av det menneskelige genomet (som mål) justert til sjimpansegenomet (som spørre) 12,5 prosent. Dermed har 12,5 prosent av basene i det menneskelige genomet ingen tilsvarende/samsvarende base i sjimpansegenomet innenfor hele genom sammenstillingen.
Figuren nedenfor - laget for illustrasjonsformål og ikke fra studien - bidrar til å vise forskjellene mellom "SNV-er" og "hull" mellom de to genomene:
Bilde 6. gaps
Som du kan se, representerer hullene nukleotider eller segmenter av nukleotider som rett og slett ikke finnes i det ene eller det andre genomet, mens SNV-ene representerer nukleotider som finnes, men er forskjellige. De to typene forskjeller kan legges sammen for å beregne den totale forskjellen mellom genomene.
Et øvre estimat
Og hvorfor er det et intervall på 12,5 prosent til 27,3 prosent i hovedteksten? Det er fordi det øvre estimatet for manglende samsvar mellom gorillagenomet og menneskets genom er hele 27,3 prosent. Faktisk, hvis vi ser på tilleggsfigur III.12, finner vi følgende prosentandeler av "gap-divergens" mellom ulike apegenomer sammenlignet med det menneskelige genomet (ikke-kjønnskromosomer), (nedre-og-øvre estimater):
*Sumatra-orangutang (Pongo abelii) vs menneske: 15,4 prosent og 16,5 prosent "gap-divergens" (dvs. minimumsforskjell)
*Gorilla (Gorilla gorilla) vs menneske: 17,9 prosent og 27,3 prosent "gap-divergens" (dvs. minimumsforskjell)
*Bonobo (Pan paniscus) vs menneske: 12,5 prosent og 14,4 prosent "gap-divergens" (dvs. minimumsforskjell)
*Sjimpanse (Pan troglodytes) vs menneske: 12,5 prosent og 13,3 prosent "gap-divergens" (dvs. minimumsforskjell)
Ser du hvor enkelt det er å oppsummere disse dataene? Dette er enorme funn for både vitenskapen og den bredere kulturen, men den tekniske Nature-artikkelen, og de to forklarende Nature-artiklene, klarte ikke å få frem disse poengene tydelig. De begravde dem i teknisk sjargong og mangel på klarhet dypt inne i tilleggsdataene, og setningen om "Den ofte siterte statistikken på ~99 prosent sekvensidentitet" ble fjernet i revisjonene av artikkelen. Nature, kan jeg trygt forsikre deg om, er ikke et tilfeldig redigert tidsskrift. Dette var bevisste valg fra noen under redigeringsprosessen. Mangelen på klarhet er rett og slett utrolig.
De tekniske detaljene
Dypt inne i tilleggsdataene finner vi figur III.12 som forklarer gapdivergensen mellom ulike arter:
Bilde 7. Tekniske sml-detaljer
Bildeteksten lyder: "Plott viser 1 Mbp-segmenter adskilt av gapdivergens for hver parvise justering", hvor en parvis justering er et forsøk på å justere to sekvenser for å bestemme graden av likhet eller forskjell. Dermed ser vi på et direkte mål på den minimale graden av forskjell mellom de to genomene.
Legge til EnkeltNukleotidVariasjonen (ENV)
Men det finnes en annen type variasjon mellom genomer som også identifiseres i artikkelen - enkeltnukleotidforskjeller (kalt "EnkeltNukleotidVariasjoner" eller noen ganger "kortNukleotidVariasjoner" eller NV-er). Igjen, begravd i tilleggsdataene finner vi figur III.11 som viser prosentandelen av ENV-er mellom menneske- og forskjellige apegenomer rapportert i denne studien. Her er hva de fant:
*Sumatraorangutang (Pongo abelii) vs menneske: ~3,6 prosent forskjell
*Gorilla (Gorilla gorilla) vs menneske: 1,9 prosent - 2,0 prosent forskjell
*Bonobo (Pan paniscus) vs menneske: 1,5 prosent - 1,6 prosent forskjell
*Sjimpanse (Pan troglodytes) vs menneske: 1,5 prosent - 1,6 prosent forskjell
Hvis vi legger til gapdivergensen til ENV-forskjellene, ender vi opp med disse totale gradene av forskjell mellom menneske- og apegenomer:
*Sumatraorangutang (Pongo abelii) vs menneske: ~19 prosent - 20,1 prosent forskjell
*Gorilla (Gorilla gorilla) vs menneske: ~19,8 prosent - 29,3 prosent forskjell
*Bonobo (Pan paniscus) vs menneske: ~14,0 prosent - 16,0 prosent forskjell
*Sjimpanse (Pan troglodytes) (mål) vs. menneske: ~14,0 prosent forskjell
*Menneske (mål) vs. sjimpanse (Pan troglodytes): ~14,9 prosent forskjell
Så det vi ser nå er at det er omtrent 14,9 prosent total forskjell mellom det menneskelige genomet og sjimpansegenomet. Det representerer en mye større grad av forskjell enn den ofte hevdede statistikken om at vi bare er 1 prosent genetisk forskjellige fra sjimpanser!
Er dette det siste ordet?
Det er utvilsomt behov for mer analyse for å avgjøre i hvilken grad nukleotider viser "en-til-en eksakt samsvar" mellom menneskets og sjimpansegenomenes genom, selv i regioner som lettere kan justeres. Så jeg mistenker at graden av forskjell mellom menneskets og sjimpansegenomenes genom kan øke i fremtiden.
Foreløpig kan vi trygt si at denne siste studien viser at menneskets og sjimpansegenomenes genom er minst 14,9 prosent forskjellige. Dette betyr at menneskets og sjimpansegenomenes genom er minst en hel størrelsesorden mer forskjellige enn offentligheten vanligvis får høre.
Bilde 8. DNA-sekvenslikhet sier egentlig ikke så mye
Selvfølgelig snakker vi her om de 44 ikke-kjønnskromosomene i det menneskelige genomet. Det er også verdt å merke seg at sammenlignet med sjimpanser har det menneskelige Y-kromosomet hele 56,6 prosent gapdivergens (og 3,9 prosent ENV-divergens), og det menneskelige X-kromosomet har 4,4 prosent gapdivergens (og 1,1 prosent ENV-divergens). Men også det er begravd i tilleggsdataene.
Dette er banebrytende funn - og det er synd at Nature ikke rapporterte dataene tydelig og gjorde alt dette så vanskelig å finne - ved å bruke sjargong som de fleste ikke-eksperter ikke forstår. Hvorfor gjorde de dette? Det er viktig å innse at publisering av vitenskapelige artikler kan være litt som pølselaging: det er ofte rotete, og den endelige formen du leser representerer vanligvis kompromissspråk som alle forfattere, anmeldere og redaktører var villige til å publisere - og representerer kanskje ikke nøyaktig hvordan hver forfatter av en artikkel føler det. Så kanskje noen forfattere av denne studien ville ha foretrukket å formulere implikasjonene tydeligere. Men vi kan fortsatt spørre: Hvorfor formulerte ikke Nature resultatene tydelig og lot brikkene falle der de vil?
Jeg mistenker at dette radikale funnet har implikasjoner - ikke bare for vitenskapen, men også for menneskelig eksepsjonalisme, for påliteligheten til sterkt markedsførte diskusjonspunkter og mer - som folk vil diskutere i lang tid. Og kanskje for noen i vitenskapens og vitenskapsrapporteringens verden, spesielt de som skrøt av det nå diskrediterte tallet om bare 1 prosent forskjell fra sjimpanser, er disse samtalene kanskje ikke velkomne.
Bilde 9. Casey Luskin
Casey Luskin er geolog og advokat med høyere grad i vitenskap og jus, som gir ham ekspertise i både de vitenskapelige og juridiske dimensjonene av debatten om evolusjon. Han fikk sin doktorgrad i geologi fra University of Johannesburg, og BS- og MS-grader i geovitenskap fra University of California, San Diego, hvor han utstrakt studerte evolusjon, både på hoved- og lavere nivå. Hans jusgrad er fra University of San Diego, hvor han fokuserte studiene på første Amendment, utdanningslov og miljørett.
Oversettelse, via google oversetter, og bilder ved Asbjørn E. Lund
------------